智能论文笔记

PointCrack3D: Crack Detection in Unstructured Environments using a 3D-Point-Cloud-Based Deep Neural Network

Faris Azhari , Charlotte Sennersten , Michael Milford , Thierry Peynot

分类：计算机视觉 | 机器人

2021-11-23

建筑物的表面裂缝，天然墙壁和地下矿井隧道可以表示严重的结构完整性问题，威胁到环境中的结构和人们的安全。及时检测和监测裂缝对于管理这些风险至关重要，特别是如果系统可以通过机器人提供高度自动化。使用深神经网络的视觉裂缝检测算法表现出墙壁或土木工程隧道等结构表面的承诺，但是工作的少量工作已经解决了高度非结构化的环境，例如岩石悬崖和裸露的采矿隧道。为了解决这一挑战，本文介绍了一个用于非结构化表面的新的3D点云的裂缝检测算法。该方法包括三个关键组件：一种自适应的下采样方法，其保持足够的裂缝点密度，将每个点作为裂缝或非裂缝分类的DNN，以及将裂缝点分成裂缝的后处理聚类方法。该方法在新的大型天然岩数据集上通过实验验证，包括跨越900米^ 2和412个单独裂缝的彩色激光雷达云。结果证明裂缝检出率为97％，最大宽度为3厘米以上的裂缝100％，显着优于现有技术。此外，对于交叉验证，PointCrack3D应用于在不同位置获取的完全新数据集，并且在培训中根本不使用，并显示为检测其100％的裂缝实例。我们还表征了检测性能，裂缝宽度和点数的点数之间的关系，为其提供了对实际部署和未来研究方向作出决策的基础。

translated by 谷歌翻译

Self-Ensembling Vision Transformer (SEViT) for Robust Medical Image Classification

Faris Almalik , Mohammad Yaqub , Karthik Nandakumar

分类：计算机视觉

2022-08-04

视觉变压器（VIT）竞争替代卷积神经网络（CNN），以完成医学成像中的各种计算机视觉任务，例如分类和分割。尽管CNN对对抗攻击的脆弱性是一个众所周知的问题，但最近的作品表明，VIT也容易受到此类攻击的影响，并且在攻击下遭受了重大的绩效退化。 VIT易于精心设计的对抗样品的脆弱性引起了人们对它们在临床环境中的安全性的严重关注。在本文中，我们提出了一种新型的自我浓缩方法，以在存在对抗性攻击的情况下增强VIT的鲁棒性。拟议的自我启发变压器（SEVIT）利用了一个事实，即通过VIT的初始块学到的特征表示相对不受对抗性扰动的影响。根据这些中间特征表示，学习多个分类器，并将这些预测与最终VIT分类器的预测相结合可以为对抗性攻击提供鲁棒性。测量各种预测之间的一致性也可以帮助检测对抗样本。对两种方式（胸部X射线和基础镜检查）进行的实验证明了SEVIT体系结构在灰色框中防御各种对抗性攻击的功效（攻击者对目标模型有充分的了解，但没有防御机制）设置。代码：https：//github.com/faresmalik/sevit

translated by 谷歌翻译

Object Detection, Recognition, Deep Learning, and the Universal Law of Generalization

Faris B. Rustom , Haluk Öğmen , Arash Yazdanbakhsh

分类：机器学习 | 人工智能 | 计算机视觉 | 神经与进化计算

2022-06-10

对象检测和识别是物种成功的基本功能。由于对象的外观表现出很大的可变性，因此大脑必须在相同的对象身份（概括过程）下将这些不同的刺激分组。泛化过程是否遵循一些一般原则，还是临时的“戏剧袋”？普遍的概括法提供了证据，表明概括遵循各种物种和任务的类似特性。在这里，我们检验了以下假设：内部表示反映了对象检测和识别环境中的自然特性，而不是系统解决这些问题的细节。通过训练“清晰”和“伪装”动物的图像的深神经网络，我们发现，有了适当的类别原型选择，概括函数是单调的，类似于生物系统的概括函数。我们的发现支持研究的假设。

translated by 谷歌翻译

Provably efficient variational generative modeling of quantum many-body systems via quantum-probabilistic information geometry

Faris M. Sbahi , Antonio J. Martinez , Sahil Patel , Dmitri Saberi , Jae Hyeon Yoo , Geoffrey Roeder , Guillaume Verdon

分类：机器学习 | (统计)机器学习

2022-06-09

量子哈密顿学习和量子吉布斯采样的双重任务与物理和化学中的许多重要问题有关。在低温方案中，这些任务的算法通常会遭受施状能力，例如因样本或时间复杂性差而遭受。为了解决此类韧性，我们将量子自然梯度下降的概括引入了参数化的混合状态，并提供了稳健的一阶近似算法，即量子 - 固定镜下降。我们使用信息几何学和量子计量学的工具证明了双重任务的数据样本效率，因此首次将经典Fisher效率的开创性结果推广到变异量子算法。我们的方法扩展了以前样品有效的技术，以允许模型选择的灵活性，包括基于量子汉密尔顿的量子模型，包括基于量子的模型，这些模型可能会规避棘手的时间复杂性。我们的一阶算法是使用经典镜下降二元性的新型量子概括得出的。两种结果都需要特殊的度量选择，即Bogoliubov-Kubo-Mori度量。为了从数值上测试我们提出的算法，我们将它们的性能与现有基准进行了关于横向场ISING模型的量子Gibbs采样任务的现有基准。最后，我们提出了一种初始化策略，利用几何局部性来建模状态的序列（例如量子 - 故事过程）的序列。我们从经验上证明了它在实际和想象的时间演化的经验上，同时定义了更广泛的潜在应用。

translated by 谷歌翻译

Group-Invariant Quantum Machine Learning

Martin Larocca , Frederic Sauvage , Faris M. Sbahi , Guillaume Verdon , Patrick J. Coles , M. Cerezo

分类：机器学习 | (统计)机器学习

2022-05-04

量子机学习（QML）模型旨在从量子状态中编码的数据中学习。最近，已经表明，几乎没有归纳偏差的模型（即，对模型中嵌入的问题没有假设）可能存在训练性和概括性问题，尤其是对于大问题。因此，开发编码与当前问题有关的信息的方案是至关重要的。在这项工作中，我们提出了一个简单但功能强大的框架，其中数据中的基本不向导用于构建QML模型，该模型通过构造尊重这些对称性。这些所谓的组不变模型产生的输出在对称组$ \ mathfrak {g} $的任何元素的动作下保持不变。我们提出了理论结果，基于$ \ mathfrak {g} $ - 不变型模型的设计，并通过几个范式QML分类任务来体现其应用程序，包括$ \ mathfrak {g} $是一个连续的谎言组，也是一个lie group，也是一个。离散对称组。值得注意的是，我们的框架使我们能够以一种优雅的方式恢复文献的几种知名算法，并发现了新的算法。综上所述，我们期望我们的结果将有助于为QML模型设计采用更多几何和群体理论方法铺平道路。

translated by 谷歌翻译

Image translation of Ultrasound to Pseudo Anatomical Display by CycleGAN

Lilach Barkat , Moti Freiman , Haim Azhari

分类：人工智能 | 计算机视觉

2022-02-16

超声是医学成像中第二大大量的模式。它具有成本效益，无害，便携式和在众多临床程序中常规实施。尽管如此，图像质量的特征是外观磨砂，较差的SNR和斑点噪声。对于恶性肿瘤，边缘是模糊的。因此，非常需要改善超声图像质量。我们假设使用神经网络可以通过转化为更现实的显示，该显示模仿了整个组织的解剖学切割，可以实现这一目标。为了实现此目标，最好的方法是使用一组配对图像。但是，在我们的情况下，这实际上是不可能的。因此，使用了循环生成的对抗网络（Cyclegan），以分别学习每个域性能并强制执行跨域循环一致性。用于训练的两个数据集该模型是“乳房超声图像”（BUSI）和在我们实验室获取的家禽乳腺组织样品的一组光学图像。生成的伪解剖图像可改善对病变的视觉歧视，并具有更清晰的边界定义和明显的对比度。为了评估解剖学特征的保存，超声图像中的病变和生成的伪解剖图像均自动分割和比较。这种比较得出的良性肿瘤的中位骰子得分为0.91，恶性肿瘤的骰子得分为0.70。良性和恶性肿瘤的中位病变中心误差分别为0.58％和3.27％，良性和恶性肿瘤的中值面积误差指数分别为0.40％和4.34％。总之，这些产生的伪解剖图像以更直观的方式呈现，可以增强组织解剖结构，并有可能简化诊断并改善临床结果。

translated by 谷歌翻译

StarNet: Joint Action-Space Prediction with Star Graphs and Implicit Global Frame Self-Attention

Faris Janjoš , Maxim Dolgov , J. Marius Zöllner

分类：机器人

2021-11-26

在这项工作中，我们提出了一种新的多模态多代理轨迹预测架构，专注于使用图形表示的地图和交互建模。出于地图建模的目的，我们将丰富的拓扑结构捕获到基于向量的星形图中，使代理能够直接参加用于代表地图的折线上的相关区域。我们表示此架构Starnet，并将其集成在单次代理预测设置中。作为主要结果，我们将此架构扩展到联合场景级预测，同时产生多个代理的预测。联合赛斯网的关键思想在自己的参考框中将一个代理的意识与其他代理人的观点察觉到。我们通过蒙面的自我关注实现这一目标。两个提出的架构都建立在我们以前的工作中介绍的动作空间预测框架之上，这确保了运动学上可行的轨迹预测。我们评估了富含互动的IND和交互数据集的方法，其中STARNET和联合星网实现了最先进的技术。

translated by 谷歌翻译